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摘 要 : 工业 过 程 常 含有 显著 的 非 线性 、 时 变 等 复杂 特性 ， 传 统 的 极限 学 习 机 有 时 无 法 充分 利用 数据 信息 ， 故 所 建 
软 测量 模型 预测 性 能 较 差 。 为 了 提高 极限 学 习 机 的 泛 化 能 力 和 预测 精度 ， 提 出 一 种 改进 粒子 群 优化 的 极限 学 习 机 软 
测量 建 模 方法 。 首 先 ， 利 用 高 斯 函数 正 态 分布 的 特点 实现 惯性 权重 的 自 适 应 更 新 ， 并 线性 变化 学 习 因 子 ， 以 提高 粒 
子 群 优化 算法 的 收敛 速度 和 搜索 性 能 ; 然后 ， 将 该 算法 用 于 优化 极限 学 习 机 的 惩罚 系数 和 核 帘 ， 得 到 一 组 最 优 超 参 
数 ; 最 后 ， 将 该 方法 应 用 于 脱 丁 烷 塔 过 程 软 测 量 建 模 中 。 仿 真 结果 表 明 ， 优 化 后 的 极限 学 习 机 模型 预测 精度 有 明显 
的 提高 ， 验 证 了 所 提 方 法 不 仅 是 可 行 的 ， 而 且 具 有 良好 的 预测 精度 和 泛 化 性 能 。 
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Soft sensor modeling for extreme learning machine based on improved particle swarm optimization 
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(a. School of Internet of Things Engineering, Jiangnan University, b. Key Laboratory of Advanced Process Control for Light 
Industry (Ministry of Education), Jiangnan University, Wuxi Jiangsu 214122, China) 


Abstract: Industrial processes often contain significant strong nonlinearity and time-varying behavior. Traditional extreme 
learning machine (ELM) based soft sensor sometimes fails to make use of data information effectively and has poor 
prediction performance. This paper proposed an improved particle swarm optimization algorithm. It has better convergence 
Speed and search ability than standard particle swarm optimization (PSO) . This algorithm with an adaptive weight updates 
learning factor linearly and plays an important role in finding the optimal penalty coefficient and kernel parameter of ELM. 
The butane concentration of debutanizer column process simulation results verify that the proposed method has good 
prediction accuracy and generalization performance. 
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0 ”引言 能 满足 实际 工业 的 要 求 。 目 前 ， 对 于 惩罚 系数 和 核 宽 两 个 参 
加 数 常 采用 人 工 选取 的 方式 ， 该 方式 建立 在 大 量 的 实验 基础 2 

实际 的 工业 生产 过 程 中 ， 存 在 许多 与 产品 质量 密切 相关 上 ， 花 费 的 时 间 较 长 ， 且 参数 设置 不 当 也 会 导致 模型 精度 不 

的 质量 变量 ， 由 于 经 济 或 技术 局 限 难 以 进行 在 线 实时 监测 和 高 ， 因 此 ， 一 些 学 者 将 群 智能 优化 算法 应 用 于 ELM 的 惩罚 
控制 ， 如 醋酸 共 沸 精 馏 中 的 醋酸 浓度 中、 油 品 黏度 及 组 分 、 系数 和 核 宽 的 选取 。Wang 等 人 023 提 出 用 灰 狼 优化 (grey wolf 
青霉素 发 酵 过 程 产物 浓度 所 等 ， 软 测量 技术 通过 构建 易 测 optimization，GWO) 算法 选取 极限 学 习 机 的 惩罚 系数 和 核 宽 ， 
助 变量 和 难 测 主导 变量 之 间 的 数学 模型 ， 可 以 很 好 地 解决 这 所 建 模型 具有 更 高 的 分 类 精度 。Lyu 等 人 0 将 改进 的 细菌 砚 
个 问题 B]。 常 用 的 软 测 量 模型 如 主 元 回归 (principal component 食 优 化 (improved bacterial foraging optimization, IBFO) 算法 
方 


regression, PCR) 册 、 偏 最 小 二 乘 (partial least squares, PLS)D]、 应 用 于 ELM 超 参 数 的 选取 ， 且 在 躯体 化 障碍 患者 的 诊断 广 
人 工 神 经 网 络 (artificial neural networks, ANN)JI9、 支 持 向 量 机 而 取得 了 成 功 的 应 用 。 然 而 GWO 算法 存在 收敛 速度 慢 、 容 
(support vector machines，SVMDJI、 高 斯 过 程 回 归 (Gaussian 易 陷入 局 部 最 优 的 缺点 ，IBFO 算法 需要 较 多 的 参数 设置 ， 


局 音 
process regression, GPR)I 等 都 可 以 得 到 良好 的 预测 结果 。 且 寻 优 性 能 很 大 程度 上 受到 趋 化 步 长 取 值 大 小 的 影响 ， 若 优 
软 测量 建 模 方法 中 ， 极 限 学 习 机 (extreme learning 化 算法 的 参数 选取 不 当 ， 仍 然 无 法 达到 提高 极限 学 习 机 模型 
machine, ELM) 匀 由 于 具有 预测 精度 高 、 学 习 速度 快 、 参 数 少 泛 化 性 能 的 目的 。 粒 子 群 优化 (particle swarm optimization， 
等 优点 ， 近 几 年 被 广泛 应 用 于 工业 过 程 。 相 比 于 传统 神经 网 PSO) 04 最 早 是 由 Kennedy 和 Eberhart 在 1995 年 提出 的 ， 该 
络 004、 最 小 二 乘 支 持 向 量 机 0 等 ，ELM 模型 克服 了 梯度 下 算法 原理 清晰 、 可 调 参数 少 且 收敛 速度 快 ， 在 机 器 学 习 算 法 
降 学 习 算法 需要 多 次 迭代 的 缺点 ， 能 在 满足 所 需 精度 要 求 的 的 性 能 提升 方面 得 到 了 较 大 的 应 用 。Lin 等 人 05 利 用 PSO 算 
同时 ， 提 高 神经 网 络 的 学 习 速 度 。 然 而 ELM 也 存在 一 些 自 法 对 SVM 进行 特征 选择 以 及 最 优 超 参数 选取 ， 明 显 提高 
身 的 不 足 ， 如 很 难 精 确 找到 最 优 超 参数 、 其 泛 化 性 能 和 预测 ”SVM 的 泛 化 能 力 和 分 类 准确 性 。 陶 新 民 等 人 09 提 出 了 一 种 
精度 也 有 待 进一步 提高 等 。 尤 其 是 参数 选取 不 当 ， 会 导致 网 改进 的 粒子 群 -K 均值 聚 类 算法 ， 该 算法 充分 利用 PSO 全 局 
络 学 习性 能 严重 不 足 ， 对 查询 样本 的 预测 能 力 变 差 ， 从 而 不 ”搜索 能 力 强 的 特性 弥补 了 K- 均 值 聚 类 算法 易 陷入 局 部 最 优 
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的 缺陷 。Grimaldi 等 人 07 将 PSO 算法 应 用 于 神经 网 络 权 值 配 
置 , 极 大 地 改善 了 网 络 的 学 习性 能 。 标准 PSO 算法 在 处 理 


2 ”改进 的 粒子 群 优化 算法 


些 简单 函数 优化 、 参 数 选取 等 问题 时 体现 出 良好 的 寻 优 性 能 ， 2.1 标准 PSO 算法 

日 是 在 求解 大 量 非 线性 、 多 峰 函 数 的 优化 问题 时 存在 早熟 收 在 D 维 空间 内 ， 种 群 规模 为 N 的 粒子 群 可 表示 为 

敛 、 精 度 不 高 、 稳 定性 差 等 缺 隐 ， 有 时 不 容易 得 到 全 局 最 优 革 =(w,x…,xXw)' eR”? ， 粒 子 的 位 置 和 速度 可 分 别 表示 为 

解 。 x =(xXipxo…,Xwp) 和 = ， 粒 子 和 整个 种 群 在 经 迭 
本 文通 过 引入 一 种 基于 高 斯 下 降 的 惯性 权重 改变 策略 ， 代 后 得 到 的 历史 最 好 位 置 ， 可 分 别 表示 为 个 体 极 值 


并 线性 变化 学 习 因 子 , 将 PSO 算法 进行 改进 ， 以 更 快 地 跳出 Peer =(Dopa po 和 群体 极 值 gs =(81,812,…, 80)"。 
局 部 最 优 ， 提 高 网 络 收敛 速度 ， 加 快 对 全 局 最 优 解 的 搜索 ， 在 寻找 最 优 值 的 迭代 中 ， 每 个 粒子 二 通过 个 体 极 值 和 群 


寻 优 效果 得 到 显著 的 提升 ， 并 将 改进 的 PSO 算法 用 于 选取 体 极 值 来 调整 自身 的 位 置 和 速度 ， 即 

ELM 的 惩罚 系数 和 核 宽 ， 得 到 由 最 优 超 参 数 确定 的 ELM 网 ER 局 
络 结构 ， 不 仅 克服 了 由 于 参数 选取 不 当 导致 神经 网 络 收敛 性 IN 

差 的 缺点 ， 而 且 明显 提高 了 ELM 模型 的 泛 化 能 力 和 预测 精 交 = 垃 + 史 (8) 
度 。 通 过 脱 丁 烷 塔 过 程 的 仿真 研究 ， 并 通过 不 同 建 模 方法 的 。 其 中 ，i=12…N ; 4=12…D， 上 为 当前 迭代 次 数 ，c,e >0 
比较 ， 对 所 提 方法 的 有 效 性 和 精度 进行 了 验证 。 为 学 习 因 子 ，. 均 为 介 于 (0,1) 之 间 的 随机 数 。 


为 了 调节 粒子 自身 历史 速度 对 当前 时 刻 的 影响 ， 以 达到 
更 好 的 优化 效果 , Shi 等 人 0 在 式 (7) 中 引入 了 惯性 权重 


1 ”极限 学 习 机 


极限 学 习 机 是 2004 年 由 Huang 等 人 提出 的 一 种 基于 单 ”于 是 得 到 
隐 层 前 馈 神 经 网 络 (single-hidden layer feedforward networks， Vv =@ 咯 二 CI 一 鸡 ) 十 ca5(P 和 一 克 ) (9) 
SLFNs) 的 学 习 算法 08， 该 算法 随机 给 定 输入 层 权 值 和 隐 含 式 (7) 和 (9) 称 为 标准 粒子 群 优化 (SPSO) 算 法 。 惯 性 权 
可 


层 节点 偏 置 ， 只 需 设置 网 络 的 隐 含 层 节点 个 数 ， 便 可 通过 求 。 重 @ 主 要 调节 局 部 搜索 能 力 和 全 局 搜索 能 力 的 平衡 ， 一 般 取 

解 线性 方程 组 的 最 小 一 乘 解 获得 输出 权 信 ， 以 此 得 到 最 优 解 。 “w=08 。 学 习 因子 we 主要 调节 个 体 极 值 和 群体 极 值 对 粒子 

D1, 的 影响 ， 通常 取 c=c =2 。 
本 本 2.2 改进 的 PSO 

于 合 个 不 同样 本 的 训练 集 {X,Y}={xi,y,}, ， 其 二 人 、 

有 标准 PSO 算法 在 搜寻 最 优 解 时 表现 了 良好 的 优化 效果 ， 

但 同时 也 存在 一 些 不 足 ， 例 如 标准 算法 在 容易 过 早 陷入 局 部 


Xi =[x 2 eR", y; =[yi, yi, Yim] eR”, n 为 输入 样本 的 


最 优 解 20， 影 响 全 局 最 优 解 的 搜索 。 为 了 解决 这 个 问题 ， 国 

维 数 ，m 为 输出 样本 的 维 数 ， 该 神经 网 络 的 输出 可 表示 为 内 外 学 者 在 研究 惯性 权重 和 学 习 因子 的 基础 上 提出 了 许多 改 
f (xi)=h(x)p =12…N (1) 进 的 PSO 算法 。 

其 中 ， 有 h(x;) 表示 隐 含 层 相 对 于 x 的 输出 向 量 ， 即 隐 含 层 输出 惯性 权重 是 粒子 群 算法 中 的 一 个 重要 参数 ， 较 大 的 惯性 

矩阵，p 表示 输出 权重 。 权重 可 以 提高 PSO 的 全 局 搜索 能 力 , 反之 有 助 于 算法 的 局 部 

ELM 的 训练 目标 是 最 小 化 训练 误差 和 输出 权 值 范 数 , 可 ”搜索 .Shi04 提 出 一 种 线性 递减 权重 的 PSO 算法 (LDWPSO) ， 

表示 为 一 个 带 约束 的 优化 问题 其 惯性 权重 的 增加 而 线性 减 小 。Amoshahy 等 人 20 提出 了 和 柔 

本 性 指数 非 线性 权重 改变 策略 。Liang 等 人 22 提 出 一 种 新 的 动 

Ce 2 全 C) ” 态 非 线性 变 惯量 权重 自 适应 变异 粒子 群 优化 算法 。 文 献 [23] 

Sth(x)B=¥ -eis N 中 介绍 了 一 种 新 的 惯性 权重 设置 方式 ， 在 线性 递减 惯性 权重 

其 中 :，e eR" 是 第 i 个 训练 样本 的 训练 误差 ，C 是 惩罚 系数 。 ”的 基础 上 做 了 改进 ， 得 到 一 种 非 线 性 递减 权重 的 PSO 算法 
求解 该 优化 问题 ， 可 得 到 ( 记 做 wiPSO) 。 

时 相 比 于 SPSO 算法 , LDWPSO 算法 在 初期 具有 更 好 的 全 


p= (Ha + Y (3) 


局 搜索 能 力 ， 后 期 具有 更 好 的 局 部 搜索 能 力 ， 但 是 该 算法 在 


二 迭代 过 程 中 全 局 搜索 和 局 部 搜索 的 比例 不 变 ， 在 求解 复杂 非 
Se a Be 0 线性 问题 时 效果 往往 不 理想 。wiPSO 算法 在 寻 优 性 能 方面 有 
维 数 为 N 的 单位 矩阵 。 应 用 Mercer’s 条 件 定义 核 和 矩阵 091: 了 一 定 的 提升 ， 算 法 的 稳定 性 和 精度 也 得 到 了 提高 。 为 了 进 
1 (4) 步 改 善 PSO 的 寻 优 效果 , 使 算法 在 搜索 前 期 具有 较 快 的 收 
人 敛 速度 ， 同 时 也 避免 搜索 后 期 过 早 陷入 局 部 最 优 ， 本 文 受 高 
在 本 文中 选用 高 斯 核 函 数 : 斯 函数 正 态 分 布 特点 的 启发 ， 引 入 一 种 高 斯 下 降 的 惯性 权重 
k(x) -exp| ea (5) % 改变 策略 ， 并 线性 变化 学 习 因 子 4 和 c 249， 以 此 得 到 改进 
~ 20 的 PSO 算法 ( 记 做 IPSO) ， 设 置 如 下 : 
其 中 : o 为 核 函数 的 宽度 参数 ， 决 定 了 核 函 数 的 径 向 作用 范 o-ilee 人 - Ke ) (10) 
围 。 此 时 ，ELM 的 输出 可 由 式 (6) 表示 。 (dx kum) 
T= pA HAT + 全] > om t (om om) x te 
K(x,xi) = (6) Cc,=C C= x k 
-| : ou + 全 | 2 2min 十 ( 2max zmin ) 大 
K(x,xn) 其 中 :Ga e[Gwascmw]; cs[cacms] ; d 为 常数 , 本 文 取 d=0.8。 


IPSO 算法 通过 采用 动态 递减 惯性 权重 , 并 同时 线性 改变 学 习 


201905.00042V1 


chinaXiv 


录用 定稿 


于 子 的 策略 ， 平 衡 了 算法 的 全 局 搜索 和 局 部 开发 能 力 ， 保 证 
了 种 群 的 多 样 性 ， 在 提高 收敛 速度 的 同时 能 够 获得 较 好 的 优 
化 结果 。 
图 1 给 出 了 三 种 不 同 PSO 算法 的 惯性 权重 变化 曲线 。 
IPSO 算法 的 惯性 权重 @ 随 迭代 次 数 的 增加 呈现 高 斯 递减 的 
下 降 趋势 ， 相 比 于 其 他 两 种 算法 ， 该 算法 在 迭代 初期 具有 较 

重 ， 收 敛 速度 较 快 ， 具 有 较 强 的 全 局 搜索 能 力 ， 
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测 模型 。 定 义 “ 粒 子 ? 为 寻 优 解 空 间 中 的 可 能 解 (C,c) ， 选 取 式 
(13) 所 示 的 均 方 根 误差 (root mean square error, RMSE) 作为 
粒子 群 算法 的 适应 度 函 数 P9， 将 计算 所 得 的 适应 度 值 记 为 


fimess(i) 。 


(13) 
其 中 :ni 为 测试 样本 个 数 ， ye 为 测试 样本 真实 值 ， yw 为 


能 够 进行 大 范围 搜索 ;在 迭代 后 期 搜索 到 最 优 值 大 致 范围 时 
设置 较 小 的 惯性 权重 ， 偏 重 发 挥 算 法 的 局 部 开发 能 力 ， 完 成 
精细 搜索 。 而 IPSO 的 学 习 因 子 " 随 迭 代 次 数 的 增加 而 减 小 ， 

局 随和 迭代 次 数 的 增加 而 增加 。 采 用 这 样 的 方式 也 是 为 了 使 粒 


模型 预测 输出 值 。 

IPSO 优化 ELM 参数 的 训练 步骤 如 下 : 

a) 初 始 化 粒子 群 算法 相关 参数 ， 主 要 有 种 群 规模 和 NN， 空 
间 维 数 D ， 学 习 因 子 c 和 c ， 惯 性 权重 w， 和 迭代 次 数 ,， 


子 的 飞行 状态 在 搜索 初期 主要 受 个 体 最 优 位 置 的 影响 ， 提 升 
粒子 在 整个 搜索 空间 的 开发 能 力 ， 而 在 搜索 后 期 粒子 的 状态 
主要 受 邻 近 粒 子 最 优 位 置 的 影响 ， 有 助 于 算法 的 局 部 开发 。 


LDWPSO 
w1PSO 
一 一 本 文 方法 


800 900 1000 


近代 次 数 k 
图 1 不 同 PSO 算法 的 惯性 权重 变化 曲线 


0 100 200 


Fig.1 Inertia weight trend of different PSO algorithms 
为 了 测试 PSO 算法 求解 复杂 问题 的 性 能 ， 选 取 标 准 测 
试 函数 中 的 Rastrigin 函数 对 SPSO、LDWPSO、wiPSO、 IPSO 
四 种 算法 进行 仿真 。 该 函数 各 变量 之 间 无 关联 ， 且 局 部 最 优 
值 随 着 正弦 波动 ， 是 一 个 典型 的 具有 大 量 局 部 最 小 值 的 复杂 
多 峰 函数 3， 函数 表达 式 如 式 (12) 所 示 。 


JCOD=y De —1l0cos(2xx)+10] (12) 


其 中 . x=[x,x,0, Nh] 


™ 


。 现 求 取 Rastrigin 函数 在 二 维 空间 


[-5,5]x[-5,5] 区 域内 的 最 小 值 ， 算 法 参数 设置 如 下 : 种 群 规模 
设 为 20, 维 数 设 为 2，cm = Cow =25 ，cm =cm=05，d=0.8， 
ve[-0.02,0.02] ，w e[-5,5;-5,5] 。 最 大 旭 代 次 数 设 为 200 次 ， 算 
法 各 实验 50 次 ， 测 试 结果 如 表 1 所 示 。 

表 1 不 同 算法 的 测试 结果 比较 


Table 1 Testresults comparison of different algorithms 
方法 最 差 值 。” 最 优 值 平均 值 方差 ”标准 差 
SPSO 3.5746 3.53x10® 0.3362 0.7312 0.8700 
LDWPSO 2.5912 1.59x103 0.3085 0.4379 0.6618 
wiPSO 2.5800 1.46x103 1.74xl0- 0.2465 0.4965 
IPSO 0.2404 4.03x10™? 6.34x103 0.0012 0.0339 


从 表 1 可 以 看 出 ， 相 比 于 其 他 三 种 算法 ， 本 文 提 出 的 
IPSO 算法 经 多 次 迭代 后 能 够 以 较 高 概率 收敛 于 全 局 最 优 解 ， 
寻 优 效果 更 好 , 可 利用 该 算法 优化 ELM 的 惩罚 系数 和 核 宽 ， 
以 期 得 到 预测 精度 更 高 的 训练 模型 ， 改 善 回 归 性 能 。 


3 ”基于 改进 粒子 群 优化 的 极限 学 习 机 


ELM 的 泛 化 性 能 在 很 大 程度 上 取决 于 其 参数 包括 惩罚 
系数 和 核 宽 的 合理 选取 。 因 此 ， 本 文 过 改进 的 粒子 群 算法 对 
极限 学 习 机 的 超 参数 进行 寻 优 ， 以 获得 精度 更 高 的 ELM 预 


粒子 的 速度 限制 newe] 和 位 置 限制 Kmy,ams] 等， 计算 第 1 
个 粒子 的 适应 度 值 timessD ， 令 最 优 适 应 度 值 
fitness(besb = fitnessd) ， 并 将 粒子 作为 pu 。 

b) 随 机 初始 化 输入 权 值 w 和 隐 仿 层 偏 置 5 , 构建 ELM 神 
经 网 络 结构 ， 并 随机 产生 一 组 数据 (C,o) 作为 初始 解 空间 。 

c) 采 用 粒子 (C,o) 对 应 的 优化 后 的 ELM 模型 对 样本 进行 
训练 , 计算 适应 度 值 并 评价 。 每 个 粒子 (C,o) 通过 比较 个 体 极 
值 的 适应 度 值 和 全 局 极 值 的 适应 度 值 来 调整 自身 的 位 置 和 速 
度 。 


qd) 判断 是 否 达 到 迭代 次 数 ， 若 达到 ， 则 算法 终止 ， 并 给 

出 搜索 结果 ， 否 则 继续 迭代 得 到 新 的 粒子 群 。 
e) 将 最 终 优化 得 到 的 粒子 (C,o) 作为 极限 学 习 机 的 惩罚 

系数 和 核 宽 ， 以 此 建立 优化 的 ELM 模型 。 

IPSO 优化 ELM 参数 的 算法 流程 如 图 2 所 示 。 


( 开始 ) ( 结 
yy 下 
初始 化 IPSO 算 法 参数 得 到 最 优 的 参数 作为 ELM 的 您 
了 罚 系数 和 核 宽 


建立 ELM 网 络 结构 个 是 
y a ~ 
输入 训练 样本 和 测试 样本 ， 初 始 化 否 狮 是 否 达到 最 大 
粒子 的 位 置 和 速度 、 和 迭代 次 数 一 
二 A 
计算 各 粒子 适应 度 值 ， 确 定 个 体 历 人 
史 最 优 位 置 和 群体 历史 最 优 位置 更 新 粒子 的 位 置 和 速度 


图 2 ”IPSO 优化 ELM 参数 的 算法 流程 
Fig.2 Flow chart of ELM algorithm with 
parameters optimized by IPSO 


4 ”仿真 研究 


4.1 ELM 算 例 仿真 

为 了 测试 ELM 的 惩罚 系数 和 核 宽 对 其 学 习性 能 的 影响 ， 
此 处 对 函数 fco =xsinx 作 回 归 分 析 。 在 本 次 实验 中 ， 随 机 生 
成 200 组 数据 {x%,fG)+6}， 其 中 100 组 作为 训练 样本 ，100 
组 作为 测试 样本 , 4 为 一 组 噪声 , 服从 正 态 分 布 ~N(0,0.05) 。 
选取 RMSE 和 跟踪 系数 (tracking precision，TP)P271 作 为 评价 
ELM 拟 合 效果 的 性 能 指标 。TP 具体 定义 如 式 (14) 所 示 。 


2 


TS (14) 


考虑 到 测试 结果 的 波动 ,每 次 实验 做 了 10 组 并 求 取 平均 
值 ， 分别 测试 ELM 的 RMSE 和 TP， 所 得 数据 如 表 2 和 3 所 
a 
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表 2 惩罚 系数 和 核 宽 对 RMSE 的 影响 测量 模型 :ELM 模型 SPSO 优化 的 ELM 模型 ( 记 为 PSOELM 
Table2 Effect of different penalty coefficient and kernel parameter 模型 ) 、IPSO 优化 的 ELM 模型 ( 简 记 为 IELM 模型 ) ， 分 别 
onRMSE 进行 仿真 实验 并 比较 。 种 群 规模 设 为 100， 最 大 友 代 次 数 设 
Co 001 0.5 5 50 100 200 1000 为 100 次 ，ve[-0.5,0.5] ，w e[6,3;2,-2] ， 其 余 参 数 设置 同 章节 
0.01 0.3235 0.0720 0.0476 0.0559 0.0558 0.0540 0.0514 2.2。 选 取 RMSE [ 式 (13) ] 、TP [ 式 (14) ] 和 相关 系数 
0.05 0.2678 0.0700 0.0561 0.0531 0.0532 0.0553 0.0575 (Correlation Coefficient, COR) [ 式 (15) ] 作为 预测 性 能 指标 。 
0.1 0.3277 0.0567 0.0553 0.0569 0.0481 0.0482 0.0525 Ge Cov(y, yo) a 
03 0.3115 0.0728 0.0574 0.0514 0.0488 0.0470 0.0570 wvar0ys) :VVar( ya) 
0.5 0.2604 0.0829 0.0505 0.0501 0.0532 0.0459 0.0469 表 4 给 出 了 三 种 建 模 方法 对 丁 烷 浓度 的 预测 结果 比较 。 
1 0.2589 0.0726 0.0537 0.0463 0.0463 0.0525 0.0508 从 表 中 可 以 看 出 ， 经 IPSO 算法 优化 后 得 到 的 IELM 模型 对 
5 0.2829 0.1414 0.0759 0.0560 0.0474 0.0545 0.0506 塔 底 丁 烷 浓 度 的 预测 精度 明显 高 于 传统 ELM 模型 ， 进 一 步 
50 0.3493 0.2302 0.1032 0.0685 0.0688 0.0736 0.0693 与 PSOELM 模型 相 比 ，IELM 模型 对 丁 烷 浓 度 的 预测 误差 减 
100 0.2695 0.2606 0.1595 0.0657 0.0855 0.0724 0.0690 小 ， 在 泛 化 性 能 方面 也 有 了 一 定 的 提升 ， 表 明 本 文 方法 可 以 
表 3 惩罚 系数 和 核 宽 对 TP 的 影响 有 效 提高 模型 的 学 习 能 力 和 预测 精度 ， 能 够 较 好 地 完成 对 了 
Table3 Effect of different penalty coefficient and kernel parameter 烷 浓 度 的 预测 。 
on TP 表 4 三 种 建 模 方法 的 预测 结果 比较 
Co 0.01 0.5 § 50 100 200 1000 Table 4 Prediction results comparison of three modeling methods 
0.01 0.2402 0.9484 0.9639 0.9541 0.9560 0.9604 0.9547 方法 RMSE COR TP 
0.05 0.3774 0.9371 0.9545 0.9555 0.9594 0.9584 0.9603 ELM 0.1051 0.7301 0.5323 
0.1 0.2955 0.9591 0.9433 0.9564 0.9701 0.9614 0.9608 PSOELM 0.0803 0.8462 0.7146 
0.3 0.3054 0.9277 0.9573 0.9667 0.9690 0.9698 0.9501 IELM 0.0746 0.8830 0.7643 
0.5 0.3236 0.8997 0.9514 0.9687 0.9589 0.9709 0.9670 为 了 更 直观 地 显示 IELM 算法 的 学 习 效 果 ， 图 4 给 出 了 
1 0.1984 0.9265 0.9573 0.9693 0.9677 0.9620 0.9625 三 种 建 模 方法 得 到 的 软 测量 模型 对 丁 烷 浓 度 的 预测 结果 。1 
5 0.0580 0.7397 0.9187 0.9590 0.9615 0.9547 0.9680 图 可 知 ，IELM 模型 对 丁 烷 浓度 的 预测 值 曲线 更 紧凑 得 跟随 
50 0.0045 0.2428 0.8272 0.9199 0.9379 0.9193 0.9303 于 真实 值 曲线 , 预测 误差 在 0 附近 波动 幅度 更 小 , 说 明 IELM 
100 0.0028 0.1196 0.6204 0.9192 0.9059 0.9282 0.9296 模型 输出 的 丁 烷 浓度 预测 值 更 接近 真实 值 ， 预 测 结果 与 真实 
从 表 2 和 3 中 可 以 看 出 , ELM 的 泛 化 性 能 与 选取 的 惩罚 情况 的 更 加 吻合 ， 预 测 产 生 的 误差 较 小 。 相 比 于 传统 ELM 


系数 和 核 宽大 小 有 很 大 关系 ， 在 本 测试 中 ， 选 取 C=200 ， 模型 仿真 结果 ， 本 文 方法 对 丁 烷 浓度 的 拟 合 能 力 更 强 ， 所 建 
c=05 时 ELM 对 该 函数 的 拟 合 性 能 较 好 ,在 参数 选取 合适 时 ， ”模型 的 泛 化 能 力 更 强 ， 预 测 精度 更 高 。 
ELM 体现 了 良好 的 学 习 能 力 , 在 噪声 存在 的 情况 下 仍 能 以 较 


入 丘 


高 精度 完成 对 函数 值 的 预测 ， 反 之 ，ELM 泛 化 性 能 较 差 。 人 
B= 预测 
4.2， 脱 丁 烷 塔 过 程 仿真 "| Peo 
脱 丁 烷 塔 过 程 是 化 工 过 程 石油 炼 制 中 脱硫 和 石 脑 油分 离 好 | 
装置 的 重要 组 成 部 分 38， 塔 底 丁 烷 浓 度 对 石油 炼 制 影响 较 大 o6| 
难以 直接 采用 仪器 测量 ， 需 要 对 该 工业 过 程 进行 软 测量 建 po 
模 。 选 取 % 顶 层 温度 、% 顶层 压力 、 回流 流量 、 进入 下 拖 
6 本 A S 0.2 坊 
一 流程 流量 、 关 第 6 塔 板 温度 、% 塔 顶 温度 1、w 塔 顶 温度 
2 等 七 个 可 测 变 量 作为 辅助 变量 , 主导 变量 为 塔 底 丁 烷 浓 度 。 op 
图 3 给 出 了 脱 丁 烷 塔 过 程 示意 图 ， 并 标注 了 辅助 变量 的 测量 -02L 一 一 一 一 一 一 
0 100 200 300 400 500 600 700 800 900 1000 
点 位 置 。 六 条 
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图 3 脱 丁 烷 塔 过 程 示意 图 样本 
Fig.3 Schematic diagram of debutanizer process (b) PSOELM、IELM 对 丁 烷 浓度 的 预测 结果 
收集 2 000 组 脱 丁 烷 塔 过 程 数据 ， 其 中 1 000 组 作为 (b) Prediction results of PSOELM and IELM for C4 concentration 


训练 样本 集 ，1 000 组 作为 测试 样本 集 ， 建 立 三 种 不 同 的 软 
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